Principal component analysis (주성분분석)
이번 포스팅에서는 Principal component analysis (주성분분석)을 정리해보고자 합니다.
PCA
Principal component analysis (주성분분석)은 데이터의 분산을 가장 잘 설명하는 축으로 데이터를 변환시키는 과정을 말합니다.
위 그림에서 기존의 축 \(x_1\) 또는 \(x_2\)로 데이터를 projection 시킬 때보다, 대각선으로 projection시킬 때 데이터가 더 넓게 분포되는 것을 볼 수 있습니다.
주성분분석은 데이터를 가장 넓게 퍼뜨리도록 하는 latent space \(z_k\)를 찾는 과정이라고 볼 수 있습니다.
Leave a comment